Leslie REGAD
2019-02-05
plasmocytes malins prennent peu à peu la place des autres cellules sanguines :
\(\rightarrow\) diminution de l’immunité humorale, anémie, infections, risque d’ecchymoses, ...
Destruction osseuse qui résulte de la décalcification en certains endroits du squelette
\(\rightarrow\) fractures peuvent aisément se produire à ces endroits
Est-ce le dosage molécule déoxypyridinoline (pyr) est un bon marqueur pour détecter la maladie ?
\(\quad\)
\(\rightarrow\) est-ce que le taux de pyr des patients malades est plus grand que celui des individus sains ?
\(\quad\)
Population = ensemble d’individus ayant des caractéristiques qui leur sont propres
Question biologique
Est-ce que le taux de pyr des patients malades est plus grand que celui des individus sains ?\(\quad\)
dataMyelom <- read.table("data/myelom.txt", sep="\t", header=T)
dim(dataMyelom)[1] 218 38
colnames(dataMyelom) [1] "numero" "diagn" "stade" "sstade" "statut" "sexe" "adiag" "typeig" "kaplam" "pyr" "bp1" "caryo" "nbchrom" "hb" "gb" "plq" "plasmo" "creat" "ctx" "ntx" "fract" "calcemie" "pic" "albumine" "beta2" "ldh"
[27] "crp" "ploid" "tt1" "etatdn" "agedg" "deldgpr" "agepr" "ageprc" "deldgdn" "delprdn" "deldn" "normchr"
str(dataMyelom[,c("diagn", "pyr")])'data.frame': 218 obs. of 2 variables:
$ diagn: int 1 1 1 1 1 1 1 1 1 1 ...
$ pyr : num 5.48 8.93 6.1 13.29 5.35 ...
diagn = 0 \(\rightarrow\) individus non maladesdiagn = 1 \(\rightarrow\) patients maladestable(dataMyelom[,"diagn"])
0 1
40 178
ind.sain <- which(dataMyelom[,"diagn"]==0)
pyr0 <- dataMyelom[ind.sain,"pyr"]ind.malade <- which(dataMyelom[,"diagn"]==1)
pyr1 <- dataMyelom[ind.malade,"pyr"]par(mar=c(3,3,1,1))
boxplot(pyr~diagn, data=dataMyelom)estimateur de l'espérance : \[ \widehat{\mu} = m = \frac{\sum_{i=1}^{n}x_i}{n}\]
by(dataMyelom[,"pyr"], dataMyelom["diagn"], mean)diagn: 0
[1] 5.6985
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
diagn: 1
[1] 7.241742
estimateur de l'espérance : \[ \widehat{\mu} = m = \frac{\sum_{i=1}^{n}x_i}{n}\]
by(dataMyelom[,"pyr"], dataMyelom["diagn"], sd)diagn: 0
[1] 2.527974
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
diagn: 1
[1] 4.089944
nb.simul <- 1000 ; val.mean <- rep(NA, length = nb.simul)
for(i in 1: nb.simul){
ech <- rnorm(n = 100, mean=14.3, sd = sqrt(24.6)) ; val.mean[i] <- mean(ech)
}
hist(val.mean,xlab="estimateur de mu", main=paste(nb.simul,"simulations", sep=" "),breaks=20)\(\quad\)
\(\quad\)
alpha <- 0.5
borneInf.0 <- mean(pyr0) - qt(1-alpha/2, df=(length(pyr0)-1)) * sqrt(var(pyr0)/length(pyr0))
borneSup.0 <- mean(pyr0) + qt(1-alpha/2, df=(length(pyr0)-1)) * sqrt(var(pyr0)/length(pyr0))
round(c(borneInf.0, borneSup.0),2)[1] 5.43 5.97
borneInf.1 <- mean(pyr1) - qt(1-alpha/2, df=(length(pyr1)-1)) * sqrt(var(pyr1)/length(pyr1))
borneSup.1 <- mean(pyr1) + qt(1-alpha/2, df=(length(pyr1)-1)) * sqrt(var(pyr1)/length(pyr1))
round(c(borneInf.1, borneSup.1),2)[1] 7.03 7.45
\(\quad\)
\(\quad\)
\(\quad\)
\(\rightarrow\) Est-ce que les données des échantillons (\(m_1\) et \(m_2\)) sont compatibles avec H0 ?
Définir un critère statistique \(S\) dont la loi sous H0 est connue
\(S = M_1 - M_2\) avec \(M\)=moyenne de \(X\) dans 1 échantillon
Calculer \(s_{obs}\) = valeur de \(S\) calculée sur les échantillons : \(s_{obs} = m_1 - m_2\)
Définir un critère statistique \(S\) dont la loi sous H0 est connue
\(S = M_1 - M_2\) avec \(M\)=moyenne de \(X\) dans 1 échantillon
Calculer \(s_{obs}\) = valeur de \(S\) calculée sur les échantillons : \(s_{obs} = m_1 - m_2\)
Définir un critère statistique \(S\) dont la loi sous H0 est connue
\(S = M_1 - M_2\) avec \(M\)=moyenne de \(X\) dans 1 échantillon
Calculer \(s_{obs}\) = valeur de \(S\) calculée sur les échantillons : \(s_{obs} = m_1 - m_2\)
\(\quad\)
si p-value > 0.05 \(\rightarrow\) non rejet de H0
\(\rightarrow\) les différences observées sur les échantillons sont expliquées uniquement par le hasard
\(\rightarrow\) aucun effet facteur
si p-value < 0.05 \(\rightarrow\) rejet de H0
\(\rightarrow\) Les différences observées ne sont pas seulement dues aux fluctuations d'échantillonnage. Il y a donc un effet du facteur
\(\rightarrow\) les différences observées sur les échantillons sont expliquées par le hasard et par le facteur
Deux erreurs possibles quand on conclut au test :
risque de 2ème espèce (\(\beta\)) : \(p(\textrm{non rejet H0 } | \textrm{ H0 est fausse})\)
Puissance du test \(\textrm{Puissance} = 1 - \beta = p(\textrm{rejet H0} | \textrm{H0 est fausse})\)
La probabilité de détecter une différence alors qu'il en existe une
t.test(pyr~diagn, data=dataMyelom, var.equal=TRUE, alternative="less")
Two Sample t-test
data: pyr by diagn
t = -2.2878, df = 216, p-value = 0.01156
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf -0.428922
sample estimates:
mean in group 0 mean in group 1
5.698500 7.241742
H0 : \(\mu_1 = \mu_2\)
Test unilatéral : un sens dans l'effet
H1 : \(\mu_1 \geq \mu_2\)
Test bilatéral : aucun sens dans l'effet
H1 : \(\mu_1 \ne \mu_2\)